NEW
快讯列表

关于 Hopper GPU 的快讯列表

时间 详情
2025-02-26
01:00
DeepGEMM库提升Hopper GPU上的FP8 GEMM性能

根据@deepseek_ai, 新推出的DeepGEMM库支持稠密和MoE GEMM,在Hopper GPU上实现了高达1350+ FP8 TFLOPS。这一进步对V3/R1训练和推理具有重要意义,为交易者提供了硬件投资和性能效率的潜在洞察。这一库设计轻量,无需重依赖,这对优化交易软件基础设施至关重要。此外,其完全即时编译的特性提升了性能,这对高频交易应用尤为重要。

来源
2025-02-24
01:34
FlashMLA内核为Hopper GPU提升性能,支持BF16

根据DeepSeek,新的FlashMLA内核针对Hopper GPU进行了优化,支持可变长度序列并已投入生产,提供BF16支持,实现3000 GB/s的内存带宽和580 TFLOPS,这可以显著提高加密交易算法的计算效率。

来源